검색결과
-
구글 앱으로 세상을 더 편리하게! 시각 장애인 위한 기능 업데이트구글은 시각 장애인과 낮은 시력을 가진 사용자들을 위한 앱 기능을 업데이트했다. Lookout 앱 업데이트 먼저, 시각 장애인을 위한 앱 'Lookout'은 새로운 "찾기" 모드를 추가했다. 이 기능을 사용하면 사용자가 카메라를 움직일 때 의자, 테이블, 화장실과 같은 7가지 종류의 물건을 인식한다. 앱은 물건의 방향이나 거리를 알려주기 때문에 사용자가 주변 환경과 더 쉽게 상호 작용할 수 있다. 또한, 앱 내 사진 촬영 버튼을 사용하여 사진을 찍으면 인공지능(AI)이 사진 속 물건을 설명해준다. Look to Speak 앱 업데이트 또한, 시각 장애인을 위한 소통 앱 'Look to Speak'도 업데이트됐다. 이 앱은 사용자가 눈 동작만으로 원하는 문구를 선택하여 다른 사람과 소통할 수 있도록 도와준다. 이번 업데이트에서는 텍스트 없는 모드가 추가돼 사용자가 다양한 이모티콘, 심볼, 사진으로 음성 합성 기능을 실행할 수 있다. 더 나아가 사용자는 각 심볼이나 이미지가 자신에게 어떤 의미를 가지는지 직접 설정할 수도 있다. 지도 앱 업데이트 지도 앱도 업데이트돼 랜드마크, 식당, ATM기 등 주변 시설의 이름과 종류, 거리 정보를 음성으로 안내한다. 또한 세부 음성 안내 기능이 강화돼 목적지까지 도달하는 길을 자세하게 알려준다. 구글은 또한 4년 전 안드로이드와 iOS에 출시한 휠체어 정보 기능을 데스크톱에서도 이용할 수 있도록 업데이트했다. '접근성 장소' 기능을 사용하면 사용자가 가려는 장소가 장애인의 필요를 충족할 수 있는지 확인할 수 있다. 예를 들어, 출입구가 편리한 업체나 공공 장소는 휠체어 아이콘으로 표시된다. 또한 이 기능을 사용하여 해당 장소에 장애인용 화장실, 좌석, 주차 공간이 있는지도 확인할 수 있다. 구글은 현재 맵스에 5천만 개 이상의 장소에 대한 접근성 정보가 있다고 밝혔다.
-
LG, 돌비 헤드 트래킹 & 어댑티브 ANC 탑재 T90S 무선 이어폰 출시LG는 최신 무선 이어폰 T90S를 출시하며 프리미엄 오디오 시장 공략에 나섰다. T90S는 돌비 헤드 트래킹과 돌비 아토모스 기술을 통해 사용자의 머리 움직임에 맞춰 3D 몰입감 넘치는 사운드를 제공한다. 또한 적응형 ANC(소음 제거) 기능과 UV 살균 기능을 갖추고 있어 편리하고 위생적인 사용이 가능하다. 돌비 헤드 트래킹과 돌비 아토모스 지원으로 몰입감 넘치는 사운드 T90S는 돌비 헤드 트래킹 기술을 통해 사용자의 머리 움직임에 맞춰 3D 사운드를 재생한다. 이는 마치 영화나 게임 속 주인공이 되어 사운드를 경험하는 듯한 몰입감을 선사한다. 또한 돌비 아토모스 지원으로 스튜디오 수준의 사운드 품질을 제공한다. 적응형 ANC와 UV 살균 기능으로 편리하고 위생적인 사용 T90S는 주변 소음 환경에 따라 자동으로 소음 제거 강도를 조절하는 적응형 ANC 기능을 갖추고 있다. 이를 통해 사용자는 어디서든 편안하게 음악을 즐길 수 있다. 또한 이어폰 충전 케이스에는 UV 살균 기능이 내장되어 있어 99.99%의 박테리아를 제거한다. 최대 36시간 배터리와 뛰어난 통화 품질 T90S는 단독 사용 시 최대 9시간, 충전 케이스를 사용하면 최대 36시간의 긴 배터리 사용 시간을 제공한다. 또한 3개의 내장 마이크와 음성 수집 장치(Voice Pickup Unit)를 통해 선명한 음질의 통화를 가능하게 한다. 기타 주요 특징 메리디안 오디오와 협업 개발 귓속형 인체공학 디자인 IPX4 방수 최대 5대 기기와 페어링 가능 3.5mm 잭 지원 LG Tone Free T90S는 블랙과 화이트 두 가지 색상으로 출시되며, 이번 달 말부터 판매될 예정이다.
-
애플, 시선 인식, 음성 단축키 등 혁신적인 접근성 기능 발표애플은 아이폰, 아이패드, 애플 비전 프로 등에 적용될 예정인 새로운 접근성 기능들을 발표했다. 이 기능들은 시각 장애인, 청각 장애인, 운동 장애인 등 다양한 장애를 가진 사용자들이 아이폰과 아이패드를 더욱 편리하게 사용할 수 있도록 돕는다. 시선 인식으로 손 쉬운 제어 가장 주목할 만한 기능은 '시선 인식(Eye Tracking)'이다. 이 기능은 앞면 카메라를 활용하여 사용자의 시선을 추적하고, 화면상에서 사용자가 보고 있는 위치를 감지한다. 사용자는 눈동작만으로 버튼을 누르거나 화면을 스크롤할 수 있다. 기존의 스위치 컨트롤이나 헤드 트래킹 방식과 비교하여 보다 자연스럽고 정확한 제어가 가능하다. 애플은 시선 인식 기능이 특히 시각 장애인에게 큰 도움이 될 것으로 기대하고 있다. 시각 장애인들은 이 기능을 활용하여 전화를 걸거나 메시지를 보내거나 웹 브라우징을 할 수 있다. 또한, 게임 개발자들은 시선 인식 기능을 활용하여 시각 장애인을 위한 새로운 게임 경험을 개발할 수도 있다. 음악 감상의 새로운 경험: 음악 햅틱 또 다른 혁신적인 기능은 '음악 햅틱(Music Haptics)'이다. 이 기능은 아이폰의 Taptic Engine을 활용하여 음악을 진동과 터치로 전달한다. 사용자들은 마치 실제로 음악을 만지는 것처럼 리듬과 베이스를 느낄 수 있다. 이는 청각 장애인뿐만 아니라 음악 감상을 새로운 방식으로 경험하고 싶은 모든 사용자들에게 매력적인 기능이다. 음악 햅틱은 사용자 정의가 가능하다. 사용자들은 좋아하는 노래에 맞게 진동 패턴을 조정할 수 있다. 또한, 화면에는 해당 노래의 가사와 함께 실시간으로 진동 패턴이 표시된다. 간편한 음성 명령: 음성 단축키 마지막으로, '음성 단축키(Vocal Shortcuts)' 기능이 소개되었다. 이 기능을 통해 사용자들은 자신만의 목소리 명령을 설정하여 일반적인 작업을 수행할 수 있다. 예를 들어, "홈 화면으로"라는 명령을 설정하면 홈 화면으로 돌아갈 수 있다. 음성 단축키는 특히 운동 장애인에게 유용하다. 운동 장애인들은 이 기능을 활용하여 화면 터치가 어려운 상황에서도 스마트폰을 손쉽게 제어할 수 있다. 또한, 시각 장애인들도 음성 단축키를 활용하여 화면 리더기를 빠르게 켜거나 끄거나 특정 앱을 실행할 수 있다. 애플의 지속적인 접근성 노력 애플은 장애인 사용자들을 위한 접근성 기능 개발에 지속적으로 노력하고 있다. 이번에 발표된 세 가지 기능은 애플의 이러한 노력의 일환이다. 시선 인식, 음악 햅틱, 음성 단축키 등은 장애인 사용자들이 스마트 기기를 보다 편리하게 사용할 수 있도록 새로운 가능성을 열어준다. 애플은 향후에도 장애인 사용자들의 요구에 맞춘 새로운 접근성 기능을 개발할 계획이다. 앞으로 어떤 혁신적인 기능들이 나올지 기대가 된다.
-
무료로 맥에서 윈도우 11 사용하기: VM웨어 퓨전 프로 13 무료화맥 사용자라면 이제 무료 소프트웨어를 활용하여 맥에서 윈도우 11을 실행할 수 있다. 기업 가상화 소프트웨어 개발업체 VM웨어(VMware)는 5월 15일 자사의 상용 제품 ‘VM웨어 퓨전 프로 13’(VMware Fusion Pro 13)을 개인 사용에 한해 무료로 제공하기 시작했다. 과거에는 윈도우를 맥에서 사용하기 위해서는 유료 부트캠프(Boot Camp) 기능이나 Parallels Desktop, VM웨어 퓨전 프로 등의 가상화 소프트웨어를 구매해야 했다. 하지만 이제 VM웨어 퓨션 프로 13을 무료로 다운 받아 맥에서 윈도우 11을 가상 머신(Virtual Machine)으로 실행할 수 있게 되었다. VM웨어 퓨전 프로 13 무료 개방, 개인 사용에 한함 VM웨어는 기존에는 윈도우, 리눅스 등 다양한 운영체제를 맥에서 가상으로 실행할 수 있도록 하는 ‘VM웨어 퓨전 플레이어’(VMware Fusion Player)와 기능이 더 강력한 ‘VM웨어 퓨전 프로’(VM웨어 퓨전 프로)를 제공했다. 하지만 퓨전 플레이어는 무료였지만, 퓨전 프로는 유료 소프트웨어였다. 최근 VM웨어는 퓨전 프로 13을 개인 사용에 한해 무료로 제공하기 시작했다. 이는 기업 사용을 위한 유료 라이선스와는 별개로 개인 사용자들이 윈도우 11과 같은 다른 운영체제를 쉽게 사용할 수 있도록 하는 전략으로 보인다. 윈도우 11 가상 머신 설치 안내 맥에서 VM웨어 퓨전 프로 13을 사용하여 윈도우 11을 가상 머신으로 실행하는 방법은 다음과 같다. - VM웨어 퓨전 프로 13 다운로드: 먼저 VM웨어 지원 웹사이트(Home - Support Portal - Broadcom support portal)로 이동한다. 오른쪽 상단 모서리 등록(Register)을 누른다. 등록 후 로그인하여 "Fusion Pro 13 Download"를 탭한다. 개인용 VM웨어 퓨전 프로 13을 탭할 수 있는 다른 페이지로 이동한다. VM웨어 퓨전 프로 13을 다운로드한다. - 설치 및 실행: 다운로드한 설치 프로그램을 실행하여 VM웨어 퓨전 프로 13을 설치한다. 설치가 완료되면 프로그램을 실행한다. - 새 가상 머신 만들기: VM웨어 퓨전 프로 메인 화면에서 ‘새 가상 머신 만들기’(Create a new virtual machine) 버튼을 클릭한다. - 윈도우 11 설치 미디어 선택: ‘설치 미디어 선택’(Installer disc or image) 항목에서 윈도우 11 설치 파일(.iso 이미지)을 선택한다. - 가상 머신 설정: 가상 머신에 할당할 CPU 코어 수, 메모리 용량, 저장 공간 등을 원하는 대로 설정한다. - 윈도우 11 설치 시작: 설정을 완료한 후 ‘만들기’(Create) 버튼을 클릭하여 윈도우 11 설치를 시작한다. 윈도우 11 설치 과정은 일반적인 윈도우 설치와 거의 동일하다. 설치 마법사의 안내에 따라 윈도우 11 설치를 완료하면 맥에서 윈도우 11을 가상 머신으로 사용할 수 있다. 무료 윈도우 11 사용의 장단점 맥에서 윈도우 11을 무료로 사용하는 것은 몇 가지 장점이 있다. 먼저, 맥 사용자들이 윈도우 프로그램이나 게임을 실행할 수 있게 된다는 점이다. 또한, 윈도우에만 호환되는 특정 소프트웨어를 사용해야 하는 경우에도 유용하다. 하지만 무료 윈도우 11 사용에는 몇 가지 단점도 있다. 먼저, 맥의 하드웨어 성능에 따라 가상 머신의 성능이 저하될 수 있다. 또한, 무료 라이선스에는 기술 지원이 제공되지 않기 때문에 문제 발생 시 스스로 해결해야 한다. 전체적으로, VM웨어 퓨전 프로 13의 무료화는 맥 사용자들에게 윈도우 11을 사용할 수 있는 새로운 기회를 제공한다. 하지만 무료 라이선스의 제한 사항과 가상 머신의 성능 한계를 고려해야 한다.
-
2027년까지 아이폰 로드맵 유출? 폴더블 아이폰, 48MP 카메라, AR 안경 등 흥미로운 정보 등장최근 온라인상에 2027년까지 애플의 제품 로드맵으로 추정되는 정보가 유출됐다. 트위터 사용자 @Revegnus1이 X에 게시한 이 정보는 아직 확인된 바 없지만, 아이폰과 맥북, 아이패드 등 다양한 제품 라인업에 대한 흥미로운 내용을 담고 있다. 아이폰 라인업 업그레이드 아이폰 16: 모든 모델 8GB 메모리로 증가하며, 일부 프로 모델은 5배 광학 줌 기능의 텔레포토 렌즈 탑재 및 화면 크기 증가(프로 6.1인치 → 6.3인치, 프로맥스 6.7인치 → 6.9인치) 예상. 아이폰 SE 4: 2025년 출시 예정인 아이폰 SE 4는 6.1인치 화면과 48MP 카메라 탑재로 이전 SE 모델에 비해 크게 향상될 것으로 예상된다. 아이폰 17 프로: 2026년 출시 예정인 아이폰 17 프로는 후면 및 전면 모두 48MP 카메라 시스템과 광학 이미지 흔들림 보정(OIS) 기능을 탑재하여 어두운 환경에서도 선명한 사진과 영상 촬영을 지원할 것으로 예상된다. 또한, 얇은 디자인과 향상된 화면 밝기를 제공하는 "폴리스 없는" 디스플레이 도입 가능성이 있다. 폴더블 아이폰 2026년 출시가 예상되는 폴더블 아이폰은 접힌 상태 6인치, 펼친 상태 8인치의 대형 화면을 제공하여 몰입감 넘치는 사용 경험을 선사할 것으로 보인다. 또한, 저지연 저전력 LLW DRAM 기술을 사용하여 최적의 성능을 발휘할 수 있을 것으로 예상된다. 아이폰 18 프로 아이폰 18 프로는 노치를 완전히 없애고 언더디스플레이 페이스아이디를 처음으로 도입하여 완벽한 전면 화면 디자인을 구현할 것으로 예상된다. 맥북 및 아이패드 라인업 2026년 출시 예정인 아이패드 에어는 10.9인치 OLED 디스플레이를 탑재하여 더욱 선명하고 깊은 색감을 선보일 것으로 예상된다. 또한, 8.4인치 OLED 아이패드 미니 출시 가능성도 있다. 맥북 역시 2026년 14인치 및 16인치 OLED 디스플레이 옵션을 선보일 것으로 예상된다. AR 안경과 폴더블 아이패드 유출된 로드맵은 2027년 이후 출시 가능성이 있는 AR 안경과 폴더블 아이패드 개발 가능성도 흘렸다. 이 제품들은 완전히 새로운 제품 카테고리를 만들어 내고 우리가 기술과 상호 작용하는 방식을 획기적으로 바꿀 수 있다 로드맵은 또한 애플이 2027년 이후 출시를 목표로 AR 안경과 foldable iPad 개념 제품을 개발하고 있다는 정보도 담고 있다. 이러한 제품들은 완전히 새로운 카테고리를 만들어 내고 우리가 기술과 상호 작용하는 방식을 크게 변화시킬 수 있다. 주의사항 이 정보는 유출된 내용이며 아직 공식 확인되지 않았음을 명심해야 한다.
-
구글, 4.7배 성능 향상된 6세대 텐서 처리 장치(TPU) '트릴리움' 출시!구글은 I/O 2024 개발자 컨퍼런스에서 데이터 센터용 6세대 텐서 처리 장치(TPU) '트릴리움(Trillium)'을 공개했다. 구글은 오랜 기간 AI 혁신에 앞장서 왔으며, 10년 넘게 GPU 분야 선구자로 자리매김해 왔다. 4.7배 성능 향상, 두 배 메모리 대역폭, 67% 에너지 효율 향상 트릴리움은 5세대 TPU 대비 칩당 컴퓨팅 성능이 4.7배 향상되었다. 이는 칩의 행렬 곱셈 장치(MXU)를 개선하고 전체 클럭 속도를 높여 달성했다. 또한, 메모리 대역폭은 두 배로 늘어났다. 트릴리움은 구글의 3세대 스파스코어(SparseCore) 기술을 적용했다. 이 기술은 "고급 랭킹 및 추천 작업에서 일반적으로 사용되는 대규모 작업을 위한 맞춤형 가속기"로 설명된다. 이를 통해 트릴리움 TPU는 모델 학습 속도를 높이고 모델 제공 시 지연 시간을 줄일 수 있다. 에너지 효율 또한 트릴리움의 주요 특징이다. 구글은 트릴리움을 "지금까지 가장 에너지 효율적인" TPU라고 강조했다. 이는 AI 칩에 대한 수요가 끊임없이 증가하고 있으며, 이는 상당한 환경 영향을 미칠 수 있다는 점을 고려할 때 특히 중요하다. 구글은 트릴리움의 에너지 효율이 이전 세대 대비 67% 향상되었다고 주장한다. '트릴리움', 고급 랭킹 및 추천 작업 속도 향상 트릴리움은 고급 랭킹 및 추천 작업에서 사용되는 대규모 모델을 학습하고 제공하는 데 특히 유용하다. 이는 검색 결과, 뉴스 피드, 추천 상품 등을 개선하는 데 사용될 수 있다. 트릴리움은 아직 출시 날짜가 정해지지 않았지만, 올해 말에 출시될 예정이다. 트릴리움의 출시는 AI 분야에서 중요한 이정표이며, 구글의 기술 리더십을 강화하는 데 기여할 것으로 기대된다.
-
구글, 자연스러운 AI 대화 기능 '제미나이 라이브' 공개지난 1년 동안 구글과 오픈AI는 인공지능 분야에서 치열한 경쟁을 벌여왔지만, 최근에는 가상 비서와의 대화 방식에 대한 관심이 다시 높아지고 있다. AI와 편안하게 대화하기! 제미나이 라이브로 자연스러운 소통 가능 일반적으로 생성형 인공지능 제품은 텍스트 입력 방식으로 출시되고, 이후 이미지 검색 및 기본적인 음성 명령 기능이 추가된다. 구글은 I/O 2024 행사에서 자연스러운 AI 대화를 위한 새로운 모바일 경험인 '제미나이 라이브'를 선보였다. 인터뷰 준비부터 연설 팁까지! 제미나이 라이브와 다양한 대화 가능 구글은 제미나이 라이브를 활용한 몇 가지 잠재적인 활용 사례를 제시했다. 예를 들어, 제미나이 라이브와 대화를 통해 면접 준비를 할 수 있으며, 면접 질문과 관련된 질문을 받을 수도 있다. 또한, 연설을 준비하는 경우 연설 팁을 받을 수도 있다. 제미나이 라이브의 가장 큰 특징은 사용자가 자신의 속도에 맞춰 대화할 수 있으며, 원하는 경우 언제든지 AI의 응답을 방해할 수 있다는 점이다. 이상적인 목표는 스마트폰 비서 명령이나 생성형 인공지능 질문을 하는 대신, 실제 사람과 대화하는 것과 같은 자연스러운 소통 경험을 제공하는 것이다. 실시간 영상 피드백도 가능! 차세대 가상 비서 '프로젝트 아스트라’ I/O 행사에서 구글은 제미나이 라이브의 개념을 더욱 발전시킨 차세대 가상 비서 '프로젝트 아스트라'도 선보였다. 아스트라는 사용자의 카메라 피드를 실시간으로 확인하고 질문에 답변할 수 있다. 아스트라 출시까지는 시간이 걸릴 것으로 예상되지만, 구글은 아스트라의 일부 실시간 영상 기능이 올해 말 제미나이 라이브에 추가될 것이라고 밝혔다. 제미나이 라이브는 향후 몇 달 안에 제미나이 어드밴스드 구독자들에게 제공될 예정이다.
-
구글, AI 안경으로 세상을 알아 가는 '프로젝트 아스트라' 공개구글은 I/O 2024 개발자 컨퍼런스에서 '프로젝트 아스트라(Project Astra)'라는 새로운 AI 기능을 공개했다. 이 프로젝트는 스마트폰 카메라와 인공지능을 활용하여 일상 속 문제 해결을 돕는다. 실시간 정보 처리로 일상 도움 프로젝트 아스트라는 뷰파인더를 기반으로 하는 앱 형태이다. 사용자가 카메라를 사무실 주변으로 돌리면서 "소리가 나는 것 알려줘"라고 말하면, 아스트라 AI가 "스피커가 보여요. 소리를 내는 거죠"라고 응답한다. 사용자가 스피커 부분을 가리키면 "저건 트위터라고 해요. 고주파 사운드를 내는 부분이죠"라고 세밀하게 설명해준다. 프로젝트 아스트라는 단순한 물체 인식뿐 아니라 창의적인 질문에도 응답한다. 예를 들어 테이블 위 크레용을 가리키면 "색채로 가득찬 창작을 만들 크레용이군요" 라고 시적인 표현을 답변한다. 기록 정보 활용하여 잊어버린 물건 찾기 더욱 놀라운 점은 프로젝트 아스트라가 시야 밖에 있는 물건도 찾을 수 있다는 것이다. 사용자가 "안경 봤던 곳 기억해?"라고 물으면 "빨간 사과 옆 책상에 있었어요"라고 정확하게 답변한다. 이처럼 아스트라는 실시간 영상과 음성 정보를 처리하는 동시에 기록된 정보를 활용한다. 따라서 시야 밖에 있던 안경도 이전에 본 정보를 바탕으로 위치를 추측할 수 있다. AI 안경 착용 시 시각적 정보 활용 프로젝트 아스트라 영상 후반부는 가상의 AI 안경을 착용한 시점을 보여준다. 안경 카메라가 칠판 다이어그램을 인식하고 "시스템 속도 향상 위해 뭘 추가할 수 있을까?"라는 질문에 "서버와 데이터베이스 사이에 캐시 추가하면 속도 빨라질 수 있어요"라고 답변한다. 사용자가 칠판에 그려진 고양이 그림을 보면서 "이게 뭘 떠올리게 해?"라고 묻자 아스트라는 "슈뢰딩거의 고양이"라고 대답한다. 또한 장난감 호랑이와 골든 리트리버를 가리키면 "이 둘에게 밴드 이름 좀 지어줘"라는 요청에 "황금 줄무늬(Golden Stripes)"라고 답변한다. 프로젝트 아스트라의 기술 데미스 하사비스 구글 딥마인드 CEO는 "프로젝트 아스트라의 에이전트는 연속적으로 비디오 프레임을 인코딩하고, 비디오와 음성 입력을 이벤트 타임라인으로 결합하며, 효율적인 정보 복원을 위해 이를 캐싱하여 빠르게 정보를 처리하도록 설계됐다"고 설명했다. 출시 시기와 향후 전망 프로젝트 아스트라는 아직 초기 단계에 있으며 출시 계획은 명확하지 않다. 하지만 하사비스 CEO는 미래에 이러한 에이전트들이 "휴대폰이나 안경을 통해" 사용될 수 있다고 언급했다. 이 안경이 실제 상품인지 구글 글래스의 후속 제품인지는 아직 알 수 없지만, 하사비스 CEO는 "일부 기능은 올해 하반기 제미나이 앱 등 구글 제품에 적용될 예정"이라고 밝혔다.
-
구글 포토, AI 채팅봇 '제미나이' 탑재해 똑똑해진다! 'Ask Photos'출시구글은 인기 사진 앱 '구글 포토'에 자체 개발한 강력한 AI '제미나이'를 도입한다. 'Ask Photos' 라는 새로운 기능을 통해 사용자는 마치 채팅처럼 텍스트 질문을 입력하면 사진 검색이 가능해진다. 더 스마트한 사진 검색 'Ask Photos'는 앱 하단의 새로운 탭으로 나타난다. 미국 영어를 시작으로 향후 몇 달 동안 구글 One 구독자에게 먼저 선행 제공된다. 이 탭을 누르면 '제미나이'의 별 모양 아이콘과 함께 "사진 검색 또는 질문하기"라는 메시지가 나온다. 예를 들어 "내가 방문했던 모든 국립공원에서 가장 멋진 사진 보여줘" 라고 질문하면 위치 정보뿐만 아니라 AI가 '최고'라는 기준을 판단해 사진을 추출해준다. 구글은 사용자가 AI가 선택한 사진을 피드백하고 더 마음에 드는 사진을 선택할 수 있다고 밝혔다. 또한 최근 휴가 사진 중 가장 뛰어난 사진을 골라주고 소셜 미디어에 올릴 수 있는 설명문까지 만들어준다. 물론 AI가 제안한 내용이 마음에 들지 않으면 나중에 수정할 수도 있다. 안전한 AI 사용 현재 'Ask Photos' 질문은 입력만 가능하며 음성 질문은 아직 지원되지 않는다. 이 기능이 출시됨에 따라 기존 검색 기능은 'Ask' 기능으로 업그레이드된다. 하지만 구글은 "얼굴 그룹이나 지도 보기 등 중요 검색 기능은 유지될 것"이라고 말했다. 구글은 'Ask Photos' 프로세스가 크게 세 부분으로 구성되어 있다고 설명했다. "질문 이해", "답변 작성", "안전 보장 및 수정 기억" 이 세 가지 과정을 거쳐 사용자와 소통한다. 특히 개인정보 보호는 전체 과정에서 중요시된다. 구글은 "사용자 사진 속 정보는 매우 개인적이며, 이를 보호하는 책임을 진지하게 생각한다"고 밝혔다. 따라서 질문은 저장되지 않고 클라우드에서 처리된다. 또한 극히 드문 경우 "악용이나 피해 해결"을 위해서만 사용자 대화 내용이나 개인 데이터를 검토한다. 구글은 "개인 데이터를 기반으로 구글 포토 외부의 어떤 제너레이티브 AI 제품도 훈련하지 않는다"고 덧붙였다. 사용자의 사진은 기존 구글 포토 사용 시 적용되는 것과 동일한 보안 및 개인정보 보호 조치 하에 안전하게 보관된다. 예를 들어 몇 년 전에 찍은 사진에서 여권이나 운전면허 만료일 같은 정보를 알려줄 수도 있다. '제미나이'는 이미지 속 텍스트를 읽어 질문에 대한 답을 찾는 등 다양한 기능을 제공한다. 물론 구글 포토는 기존에도 "신용카드" 또는 특정 친구 이름과 같은 키워드로 사진 검색이 가능했다. 하지만 '제미나이' AI는 단순히 사진 검색 기능을 넘어 텍스트 질문을 통해 사용자의 의도를 이해하고 더 많은 정보를 제공한다. 예를 들어 파트너나 아이의 생일 파티 사진을 바탕으로 어떤 테마를 사용했는지 알려줄 수도 있다. ’Ask Photos‘ 에는 현재 실험적인 기능이며 "곧 출시될 예정"인 유망한 사용 사례가 많이 있다. 다른 사진 도구와 마찬가지로 One 구독자 및 Pixel 소유자를 위한 프리미엄 기능으로 시작하여 무료 앱을 사용하는 모든 사람에게 배포될 수 있을 것으로 보인다.
-
구글 I/O 2024: 인공지능 돌풍! 제미나이 업그레이드와 혁신 기능 공개올해 구글 I/O 컨퍼런스는 인공지능 관련 발표로 가득 찼다. 예상대로 구글은 자사의 제미나이 인공지능 모델과 워크스페이스, 크롬 등 앱과의 연동 방식에 중점을 두었다. 구글 렌즈 영상 검색 기능 강화 기존 구글 렌즈는 이미지를 기반으로 검색이 가능했지만, 이제는 영상 검색 기능까지 추가되었다. 검색하려는 영상을 촬영하여 질문을 하면 구글 인공지능이 웹에서 관련 답변을 찾아낸다. 더욱 빠르고 강력해진 제미나이1.5 플래시 구글은 새로운 인공지능 모델인 제미나이1.5 플래시(Gemini 1.5 Flash)를 출시했다. 이 새로운 멀티모달 모델은 제미나이1.5 프로와 동등한 성능을 가지지만, "특정 분야, 고빈도, 저지연 작업"에 최적화되어 더 빠른 응답 생성이 가능하다. 또한 구글은 제미나이1.5의 번역, 추론, 코딩 기능을 향상시켰으며, 맥락 창 크기를 100만 토큰에서 200만 토큰으로 늘렸다. 워크스페이스에 제미나이도입 구글은 최신 메인스트림 언어 모델 제미나이1.5 프로를 문서, 스프레드시트, 프레젠테이션, 드라이브, 이메일에 통합했다. 다음 달 유료 구독자들에게 제공되는 이 기능은 워크스페이스 내에서 다목적 기능의 도우미 역할을 할 것이다. 사용자의 드라이브 콘텐츠 어디에서든 정보를 가져와 현재 보고 있는 문서 내용을 바탕으로 이메일을 작성하거나 나중에 답변할 이메일을 알려주는 등의 기능을 수행한다. 일부 초기 테스터들은 이미 이 기능을 사용하고 있으며, 구글은 다음 달 모든 유료 제미나이구독자들에게 제공할 예정이다. 프로젝트 아스트라: 구글의 야심찬 인공지능 비서 프로젝트 아스트라(Project Astra)는 사용자의 기기를 통해 보고 있는 것을 이해하고 기억하며 사용자 대신 작업을 수행하는 모든 기능을 갖춘 가상 비서가 되기 위한 구글의 계획이다. 올해 I/O 컨퍼런스에서 가장 인상적인 데모 중 많은 부분을 지원하는 프로젝트 아스트라는 단순히 대화만 할 수 있는 것이 아니라 실제로 사용자를 대신하여 작업을 수행할 수 있는 진정한 인공지능 에이전트가 되는 것을 목표로 한다. Veo: 영상 제작자 위한 혁신 도구 구글은 텍스트, 이미지, 영상 기반 프롬프트를 기반으로 1080p 영상을 생성할 수 있는 새로운 생성 인공지능 모델인 Veo를 선보였다. 영상은 항공 촬영이나 타임랩스와 같은 다양한 스타일로 제작할 수 있으며, 추가 프롬프트를 통해 미세 조정이 가능하다. 구글은 이미 일부 제작자들에게 Veo를 제공하며 영화에 사용하기 위해 할리우드에도 홍보하고 있다. Gems: 맞춤형 채팅봇 제작 툴 구글은 사용자가 제미니에게 지시를 제공하여 원하는 방식으로 응답하고 특정 분야에 특화된 맞춤형 채팅봇을 만들 수 있는 Gems라는 툴을 출시했다. 예를 들어, 매일 동기 부여와 달리기 계획을 제공하는 긍정적이고 적극적인 달리기 코치가 되도록 설정할 수 있다 (물론 제미나이 고급(Advanced) 구독자만 가능하다). 실시간 음성 대화 기능 향상된 제미나이 Live 새로운 제미나이 Live 기능은 제미니와의 음성 대화를 보다 자연스럽게 만든다. 챗봇의 목소리에 더 많은 개성이 부여되고, 사용자는 중간에 말을 끼거나 스마트폰 카메라를 통해 주변을 보여주면서 실시간 정보를 제공하도록 요청할 수 있다. 또한 제미나이는 Google Calendar, Tasks 및 Keep와의 새로운 통합을 통해 멀티모달 기능을 사용하여 정보를 업데이트하거나 가져올 수 있다. 수학 문제 도우미 서클 투 서치 안드로이드 휴대폰이나 태블릿 사용자는 이제 화면에서 수학 문제를 원으로 둘러싸고 풀이 방법을 얻을 수 있다. 구글 인공지능은 문제를 해결해주지는 않지만 (학생들이 숙제를 속이는 데 도움이 되지 않도록), 문제를 완료하기 쉽도록 단계별로 안내해 줄 것이다. AI 검색 개편된 Google 검색 구글은 이전에 "Search Generative Experience"라고 불렸던 "AI 오버뷰(AI Overviews)"를 미국 모든 사용자에게 제공할 예정이다. 이제 "전문화된" 제미나이 모델은 웹에서 요약된 답변으로 결과 페이지를 디자인하고 채운다 (Perplexity 또는 Arc Search와 같은 AI 검색 도구에서 볼 수 있는 것과 유사). 안드로이드 스캠 방지 기능 구글은 안드로이드 휴대폰이 일반적인 사기꾼 대화 패턴과 같은 위험 신호를 찾아 실시간 경고를 띄워 사기 전화를 피하도록 돕는다고 말했다. 이 기능에 대한 자세한 내용은 올해 말에 발표될 예정이다. AI 질문 응답 기능 강화된 안드로이드 구글은 곧 사용자가 화면에 표시된 영상에 대해 질문을 할 수 있도록 하고, 제미니는 자동 자막을 기반으로 답변할 것이라고 발표했다. 유료 제미나이 고급 사용자의 경우 PDF 파일을 수집하여 정보를 제공할 수도 있다. 이러한 기능과 안드로이드용 제미니의 다른 멀티모달 업데이트는 향후 몇 달에 걸쳐 출시될 예정이다. 크롬 내장 AI 도우미 구글은 데스크톱용 크롬에 제미니의 가벼운 버전인 제미나이 나노를 추가한다고 발표했다. 이 내장된 도우미는 온디바이스 인공지능을 사용하여 사용자가 소셜 미디어 게시물, 제품 리뷰 등을 위한 텍스트를 직접 크롬에서 생성하도록 돕는다. SynthID 인공지능 워터마킹 업그레이드 구글은 SynthID가 할 수 있는 작업을 확장한다고 발표했다. 이제 SynthID는 새로운 Veo 비디오 제작 도구를 사용하여 만든 콘텐츠에 워터마킹을 포함하고 AI 생성 비디오를 감지할 수도 있다. 결론 구글 I/O 2024는 인공지능 기술의 발전을 보여주는 흥미로운 행사였다. 제미나이 모델의 업그레이드, 새로운 제품 및 기능 출시는 향후 몇 년 동안 인공지능 기술의 발전 방향에 큰 영향을 미칠 것으로 예상된다.